যথার্থতা যাচাই এর জন্য ব্যবহৃত বিভিন্ন স্ট্যাটিস্টিক:
যথার্থতা যাচাই পরিসংখ্যানের গুরুত্বপূর্ণ একটি দিক। এর মাধ্যমে ডেটা বা পরিমাপের সঠিকতা ও নির্ভুলতা নির্ধারণ করা হয়। নিচে যথার্থতা যাচাইয়ের জন্য ব্যবহৃত বিভিন্ন গুরুত্বপূর্ণ স্ট্যাটিস্টিক তুলে ধরা হলো:
১. গড় ত্রুটি (Mean Error):
- সংজ্ঞা: গড় ত্রুটি হলো পরিমাপকৃত মান এবং প্রকৃত মানের মধ্যে গড় পার্থক্য।
- সূত্র:
\[
\text{Mean Error} = \frac{\sum_{i=1}^{n} (X_i - T)}{n}
\]
যেখানে,
\(X_i\) = পরিমাপকৃত মান
\(T\) = প্রকৃত মান
\(n\) = মোট পরিমাপের সংখ্যা
২. গড় বর্গমূল ত্রুটি (Root Mean Square Error - RMSE):
- সংজ্ঞা: এটি একটি বহুল ব্যবহৃত পরিসংখ্যান, যা ত্রুটির স্কোয়ারের গড়ের বর্গমূল নির্দেশ করে। এটি ডেটার বিচ্যুতি পরিমাপ করে।
- সূত্র:
\[
\text{RMSE} = \sqrt{\frac{\sum_{i=1}^{n} (X_i - T)^2}{n}}
\]
৩. গড় আপেক্ষিক ত্রুটি (Mean Absolute Error - MAE):
- সংজ্ঞা: পরিমাপকৃত মান এবং প্রকৃত মানের মধ্যে গড় আপেক্ষিক পার্থক্য। এটি ত্রুটির একটি সরল মাপকাঠি।
- সূত্র:
\[
\text{MAE} = \frac{\sum_{i=1}^{n} |X_i - T|}{n}
\]
৪. শতকরা ত্রুটি (Percentage Error):
- সংজ্ঞা: পরিমাপকৃত মানের শতকরা বিচ্যুতি।
- সূত্র:
\[
\text{Percentage Error} = \frac{|X - T|}{T} \times 100%
\]
৫. সহগ (Coefficient of Variation - CV):
- সংজ্ঞা: এটি গড় মানের তুলনায় ডেটার বিচ্যুতি নির্ধারণ করে।
- সূত্র:
\[
\text{CV} = \frac{\sigma}{\mu} \times 100
\]
যেখানে,
\(\sigma\) = ডেটার মানের স্ট্যান্ডার্ড ডেভিয়েশন
\(\mu\) = গড়
৬. নির্ভুলতার সহগ (Accuracy Ratio):
- সংজ্ঞা: এটি পরিমাপের সঠিকতা বুঝাতে ব্যবহৃত হয় এবং প্রকৃত মানের সাথে ডেটার সামঞ্জস্যতা নির্দেশ করে।
- সূত্র:
\[
\text{Accuracy Ratio} = \frac{\text{Predicted Value}}{\text{Actual Value}}
\]
৭. কপেলার সহগ (Correlation Coefficient):
- সংজ্ঞা: এটি দুই ডেটাসেটের মধ্যে সম্পর্ক নির্ধারণ করতে ব্যবহৃত হয়। যথার্থতার জন্য উচ্চতর সহগ ভালো বলে ধরা হয়।
- সূত্র:
\[
r = \frac{\sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y})}{\sqrt{\sum_{i=1}^{n} (X_i - \bar{X})^2 \cdot \sum_{i=1}^{n} (Y_i - \bar{Y})^2}}
\]
৮. স্ট্যান্ডার্ড ডেভিয়েশন (Standard Deviation):
- সংজ্ঞা: এটি ডেটাসেটের গড় থেকে বিচ্যুতির গড় নির্দেশ করে। কম স্ট্যান্ডার্ড ডেভিয়েশন উচ্চ যথার্থতা নির্দেশ করে।
- সূত্র:
\[
\sigma = \sqrt{\frac{\sum_{i=1}^{n} (X_i - \bar{X})^2}{n}}
\]
৯. R-Squared (Coefficient of Determination):
- সংজ্ঞা: এটি একটি পরিসংখ্যান, যা পূর্বানুমান এবং প্রকৃত ডেটার মধ্যে সামঞ্জস্যতা নির্দেশ করে।
- রেঞ্জ: ০ থেকে ১ (১ হলে এটি পূর্ণ সঙ্গতিপূর্ণ)।
উপসংহার:
উপরোক্ত পরিসংখ্যানগুলো ব্যবহার করে যথার্থতা যাচাই করা যায়। নির্ভুলতা এবং সঠিকতা নিশ্চিত করতে এই মেট্রিক্সগুলো গবেষণা ও বিশ্লেষণে গুরুত্বপূর্ণ ভূমিকা পালন করে।
Content added By
Read more